数值分析：超越插值——近似理论的哲学

插值假设数据是纯净的。在现实世界中，数据杂乱无章、充满抖动和噪声。当我们坚持必须精确命中每一个数据点时，我们找到的不是真相——而是混乱。今天，我们将超越对精确性的僵化要求，进入近似的哲学领域近似。

精确性的失败

尽管高次多项式可以经过每一个数据点，但通常会产生类似龙格（Runge）的振荡。这些剧烈的波动与底层物理过程毫无关联。 因此，要求近似函数与数据完全一致是不合理的尤其当测量存在变异性时更是如此。

定义“最佳”拟合：三种范数

为了实现近似，我们必须定义一个误差函数 $E$。我们衡量“接近程度”的方式将彻底改变结果：

1. 极小极大问题（$L_{\infty}$ 范数）

旨在最小化可能的最大误差：

$$E_{\infty}(a_0, a_1) = \max_{1 \le i \le n} \{|y_i - (a_1 x_i + a_0)|\}$$

缺陷： 极小极大方法通常会给那些严重出错的数据赋予过高的权重。

2. 绝对偏差（$L_1$ 范数）

绝对差值之和：

$$E_1(a_0, a_1) = \sum_{i=1}^{n} |y_i - (a_1 x_i + a_0)|$$

缺陷： 绝对值函数在零点不可导，我们可能无法解析地求解这一组方程。

3. 最小二乘法的优越性（$L_2$ 范数）

数值分析中的标准方法，对残差进行平方：

$$E_2(a_0, a_1) = \sum_{i=1}^{n} [y_i - (a_1 x_i + a_0)]^2$$

这创造了一个平滑且可导的曲面，使得微积分能够轻松找到全局最小值。

解析约束

选择度量标准是逻辑与微积分之间的权衡。例如，绝对偏差方法对明显偏离近似值的点赋予的权重不足，而 $L_2$ 提供了一个稳健的中间方案，在惩罚大离群点的同时，不会被单个异常数据点完全主导。

🎯 核心原则

近似是一门忽略噪声以发现信号的艺术。通过从点匹配转向误差最小化，我们得以恢复被测量变异性所掩盖的真实物理定律。

问题 1

为什么高次插值多项式通常不适合实验数据？

它在计算上过于简单，无法表示复杂的物理规律。

它会导致类似龙格的振荡，捕捉的是噪声而非趋势。

它总是产生线性结果，忽略了数据的曲率。

它在任何点都不可导。

问题 2

极小极大问题主要使用哪种误差范数？

$L_1$ 范数（绝对偏差之和）

$L_2$ 范数（最小二乘法）

$L_\infty$ 范数（最大绝对误差）

格拉姆-施密特范数

问题 3

绝对偏差（L1）方法的主要计算缺陷是什么？

它对小的离群值过于敏感。

它要求所有计算都使用切比雪夫多项式。

绝对值函数在零点不可导。

它仅适用于超过 100 个数据点的数据集。

问题 4

哪种范数能在显著惩罚大离群点的同时，又不让单一误差主导整个拟合？

$L_1$ 范数

$L_2$ 范数（最小二乘法）

$L_\infty$ 范数

龙格范数

问题 5

在下落物体的例子中，为何使用最小二乘二次函数而非高次多项式？

为了确保物体沿直线运动。

为了捕捉相机支架的每一次振动。

为了忽略相机的‘抖动’，还原重力的物理定律（$y = at^2$）。

因为高速相机无法记录超过 3 个数据点。